BITS Meetings' Virtual Library:
Abstracts from Italian Bioinformatics Meetings from 1999 to 2013


766 abstracts overall from 11 distinct proceedings





Display Abstracts | Brief :: Order by Meeting | First Author Name
1. Anselmi C, Bocchinfuso G, De Santis P, Fu L-M, Savino M, Scipioni A
A Theoretical Model to Predict Intrinsic and Induced Superstructures of DNAs and Some Relevant Thermodynamic Properties from the Sequence
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The substantial conformational homogeneity of DNA double helix has recently allowed a good progress in the knowledge of the molecular mechanisms which control the functional organization of the genome as well as in the prediction of some biologically relevant structural properties. We developed an analytical method to study the effects of the sequence on modeling the three-dimensional superstructure of DNA based on the theoretically evaluated slight conformational perturbations of the different dinucleotide steps along the sequence. Such a model is capable of predicting in striking agreement with the experimental data: the atomic force microscopy visualization of relevant DNA tracts and in particular the dynamics of a pBR322 plasmide after the mechanical cut of the cycle; the gel electrophoresis anomalies of a very large pull of DNA tracts; the thermodynamic constants of the sequence dependent circularization reactions of many DNAs ranging from 100 to 100000 bp and the sequence dependent writhing transitions from relaxed to supercoiled circular forms also in the presence of DNA binding proteins; and finally, the nucleosome positions and the corresponding thermodynamic stability of more than 50 DNA tracts whose the nucleosome competitive reconstitution experimental data are available. The thermodynamic properties were obtained using an original statistical mechanic approach based on the first order elasticity which allows an analytical solution in Fourier space.

2. Anselmi C, Bocchinfuso G, De Santis P, Scipioni A
Topological Invariants in Protein Folding and Their Scaling Properties
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The problem of the three-dimensional structure prediction in terms of the amino acid sequence is still an open question in spite of the progress of the conformational analysis and the molecular dynamics as well as of the more accurate knowledge of the force field. Some years ago we proposed a model which addresses the problem of the general trend of protein folding. Such transconformational process involves entangled movements of the polypeptide chain which are however progressively hampered by the growing importance of long range interactions whence only concerted transconformations can take place. We investigated the topological aspects of such constrained transformations and found that they are characterized by the invariance of the linking number of the polypeptide chain fitting ribbon in order to avoid the overcoming of high conformational energy barriers which would severely repress the kinetics of the process; under such a topological constraint the transconformations become highly cooperative. In order to select the topologically invariant pathways we have identified some significant parameters which characterize all the proteins independently of their tertiary structures. One of these is a topological parameter which quantifies the complexity of folding as the number of chain crossing averaged over all the possible projections of the structure. It is easily calculated and shows interesting and useful fractal properties. Using a folding representation as a complex function of the sequence we are at present trying extending to proteins the model we successfully developed to predict the superstructures of DNA.

3. Antolini F, Lo Bello M, Helmer-Citterich M, Sette M, Pelicci PG
PML heptads purification and preliminary characterization
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The PML gene is involved in the 15;17 chromosomal translocation of acute promyelocytic leukemias (APL). It encodes a nuclear phosphoprotein which is associated, in vitro, with growth suppressor activity. We are currently studying the biochemical and biological properties of the coiled-coil region of the PML protein. It consists of four clusters of hydrophobic aminoacids and is thought to mediate homodimerization and heterodimerization with the PML/RARa mutant protein. The integrity of this region is required for the biological activity of PML and PML/RARa mutant protein. In this report we show the production of PML-heptads as a fusion protein with p-GEX vector. The fused protein was first solubilized, then purified with affinity chromatography. The heptads were obtained after column proteolitic cleavage, then were further analized with FPLC. The FPLC chromatograms, carried out in non denaturing conditions, show the ability of the heptads to elute as a high molecular weight aggregate confirming the evidence that this region is responsible for protein complex formation in "in vivo" experiments. Finally the purified peptide was structurally characterized by means of circular dichroism (CD) measurements. The CD spectra indicate the presence of an a-helix structure. A molecular model of heptad dimer, based on the sequence comparison with other homologue sequences, is also presented.

4. Attimonelli M, Altamura N, Boyen C, Benne R, Brennicke A, Carone A, Cooper JM, D'Elia D, De Montalvo A, De Pinto B, De Robertis M, Golik P, Grienenberger JM, Knoop V, Lanave C, Lazowska J, Lemagnen A, Malladi SB, Memeo F, Monnerot M, Pilbout S, Schapira AHV, Sloof P, Slonimski P, Stevens K, Saccone C
MitBASE : a comprehensive and integrated mitochondrial DNA Database
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: MitBASE is an integrated and comprehensive database of mitochondrial DNA data which collects all available information from different organisms and from intraspecies variants and mutants. Excellent research institutions from different countries are involved, each in charge of developing, collecting and annotating data for the organisms they are specialised in. The design of the actual structure of the database and its implementation in a user- friendly format are the care of the European Bioinformatic Institute. The database can be accessed on the Web at the following address: http://www.ebi.ac.uk/htbin/Mitbase/mitbase.pl. The impact of this project is outstanding both for basic and applied research, such as the study of mitochondrial genetic diseases and mitochondrial DNA intraspecies diversity exploited in several biotechnological fields. The database has been funded within the EU Biotechnology programme.

5. Attimonelli M, Cooper JM, D'Elia D, De Montalvo A, De Robertis M, Lehvaslaiho H, Malladi SB, Memeo F, Stevens K, Schapira AHV, Saccone C
Update of the human mitBASE database
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Human MitBASE is a database collecting human mtDNA variants. This database is part of a greater mitochondrial genome database (MitBASE) funded within the EU Biotech Program (1). The present paper reports the recent improvements in data structure, data quality and data quantity. As far as the database structure is concerned it is now fully designed and implemented. Based on the previously described structure (2) some changes have been made to optimise both data input and data quality. Cross-referencings with other bio-databases (EMBL, OMIM, MEDLINE) have been implemented. Human MitBASE data can be queried with the MitBASE Simple Query System (http://www.ebi.ac.uk/htbin/Mitbase/mitbase.pl.) and with SRS at the EBI under the ìMutationî section (http://srs.ebi.ac.uk/srs5/ ). At present the Human MitBASE node contains about 5000 variants related to studies investigating population polymorphisms and pathologies.

6. Brannetti B, Via A, Cesareni G, Helmer-Citterich M
Predizione della specificità di riconoscimento dei domini SH3
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Scopo di questo lavoro è lo sviluppo di un programma per calcolatore in grado di predire la specificità di legame di un dominio SH3 sulla base della sola sequenza. Il database di dati cristallografici comprende una decina di complessi SH3/peptide o proteina. Considerando anche dati sull'interazione tra SH3 e peptidi disponibili in letteratura o ricavati da esperimenti di phage display, possiamo costruire una matrice di frequenze di interazioni residuo-residuo tra posizioni nella sequenza degli SH3 e posizioni nella sequenza del ligando. La matrice dei contatti SH3/peptide può essere utilizzata allo scopo di valutare coppie di sequenze SH3/peptide e predire la loro capacità di legame. La matrice delle frequenze dei contatti contiene una quantità di informazione ovviamente limitata dal database di interazioni su cui è costruita, inoltre non contiene punteggi negativi. Abbiamo costruito una seconda matrice SH3 specifica, ottenuta dalla matrice delle frequenze dei contatti arricchita con il metodo dei profili (Gribskov et al., 1987). La matrice dei profili è completamente piena (contiene uno score anche per residui non ancora inclusi nel database SH3/peptidi di partenza) e contiene sia valori positivi che negativi. Entrambe le matrici possono venire usate per produrre funzioni di score e valutare probabilità di legame tra sequenze di domini SH3 e peptidi, sequenze di proteine o intere banche dati di proteine in tempi molto contenuti (circa 30 minuti cpu su una Silicon Graphics R5000 per analizzare l'intera banca dati delle sequenze delle proteine del PDB, circa 14000 sequenze). Il metodo è stato messo a punto nello studio dell'interazione tra SH3 e peptidi, ma può essere facilmente applicato anche allo studio di diversi domini di interazione protein-proteina (domini SH2, PH, MHC etc.). Stiamo al momento valutando le prestazioni del metodo con le due diverse matrici descritte. E' importante sottolineare che, all'aumentare del database che costituisce la base informativa iniziale (con altre strutture e/o con altri dati di interazione provenienti da letteratura o phage display) ci aspettiamo un consistente aumento del potere predittivo del metodo.

7. Casadio R, Compiani M, Fariselli P, Martelli PL
A data base of minimally frustrated alpha-helical segments extracted from proteins according to an entropy criterion
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Supervised Neural Networks have been proved to be some of the most efficient tools to predict secondary structure of proteins from their aminoacid sequences. We developed a method that is able to evaluate the reliability of the predictions and the stability of helical structural motifs. A neural network with a 13 residue-long input window and a 2 neuron output is trained to recognize 2 classes: residues that have or not have a native a-helical structure in the protein data base. The two activations of the output neurons are interpreted as the probabilities for the central residue of the input fragment to be or not to be in helical structure and the Shannon entropy of the output is used as a measure of the prediction reliability . A data base of minimally frustrated alpha helical segments is then defined by filtering a set comprising 822 non redundant proteins, which contain 4783 alpha helical structures. The data base definition is performed using the neural network-based alpha-helix predictor, whose outputs are rated according to an entropy criterion. A comparison with the presently available experimental results indicates that a subset of the data base contains the initiation sites of protein folding experimentally detected and also protein fragments which fold into stable isolated alpha-helices. This suggests the usage of the data base (and/or of the predictor) to highlight patterns which govern the stability of alpha helices in proteins and the helical behavior of isolated protein fragments.

8. De Sanctis L, Parisi V, Cattaneo A
Numerical simulation of a kinase/phosphatase network for signal transduction in PC12 cells
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Recent genetic, biochemical and structural data has focused the attention on conserved protein modules that regulate signal transduction trough their ability to mediate protein-protein interactions. These conserved modules represent common regulatory features of many distinct signalling pathways which are used to build up complex networks of interacting proteins. Many extracellular polypeptide signaling hormones, such as growth factors, trigger intracellular cascades of phophorylation/dephosphorylation events, mediated by kinases and phosphatases. With the idea of modeling these signaling pathways, we have studied the time evolution of protein networks made of kinases and phosphatases. These protein networks formally resemble attractor neural networks (ANNs), and, like ANN, their steady states can be thought of as encoding the input. Inputs will be recognized as different, if they lead the network into different steady states. Equations for the kinase networks were derived, based on simple enzyme kinetics considerations, and the general properties of the solutions were studied with the tools of qualitative analysis of dynamical systems. A specific network, describing many of the known signal transduction proteins activated by the polypeptide growth factors EGF and NGF in the cell line PC12, was simulated, and the solutions studied by numerical analysis. These cells use a largely overlapping set of signal transduction proteins to respond to the two factors in two opposing ways, proliferation (with EGF) and differentiation and mitotic arrest (with NGF). The results obtained from the simulations were in striking agreement with many experimental data, even with most parameters chosen over a wide interval, showing a great robustness of the property of the network to discriminate between to stimuli. sWith the forthcoming completion of genome sequence projects, and the undertaking of genome-wide protein linkage mapping studies, we believe that the quantitative study of assemblies and networks of proteins will represent a fundamental aspect of their understanding.

9. Facchiano AM
WEBIOLAB: WEb BIOinformatics LABoratory to investigate protein structure and function.
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Bioinformatics applications require the joint use of different resources: databases, query systems, sequence analysis tools, software for 3D structure prediction and analysis. I am working to set up WEBIOLAB, a bioinformatics laboratory on the web (http://crisceb.area.na.cnr.it/angelo/services.html), where people interested to the investigation of protein structure and function can find tools useful for their work. Up today, the main task of this project was to arrange a large number of public databases (over 60 up to now, and the number is growing), which can be searched by means of the Sequence Retrieval System (SRS). Standard settings of SRS version 5.1.0 provide links among databases, and I am working to improve them with the aim to obtain a more powerful network. WEBIOLAB also includes local copies of public domain web tools for protein sequence analysis and 3D visualization. Many public domain programs for protein structure analysis and prediction are restricted to local users; the plan is to make them available within WEBIOLAB, also by exploiting the ability of SRS to submit entries of databases to applications. The next step of this work will be the implementation of appropriate interfaces to original tools developed to perform specific analyses of 3D structures of proteins, successfully used within our research projects.

10. Falconi M, Iovino M, Luise A, Desideri A
Metodi di simulazione applicati allo studio delle metallo-proteine
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Il Gruppo di Biochimica Computazionale del Dipartimento di Biologia dell'Universita' di "Tor Vergata" si occupa della razionalizzazione dei meccanismi molecolari che esprimono la funzionalita' delle macromolecole biologiche utilizzando metodi di indagine quali la dinamica molecolare, la dinamica Browniana, la modellazione molecolare, il calcolo dei potenziali elettrostatici e l'analisi delle sequenze. Per la modellazione molecolare viene utilizzato del software commerciale quale SYBYL 6.2 della Tripos ed INSIGHT II release 97 della Molecular Simulation (MSI). Questa tecnica e' stata applicata alla ricostruzione tridimensionale di superossido dismutasi a Cu,Zn (SOD) di varie specie e recentemente alla proteina necessaria per l'incorporazione del rame nella SOD a Cu,Zn (copper chaperone for superoxide dismutase). L'analisi del modello ha rivelato la presenza di domini specializzati per precise funzioni di riconoscimento, riserva e trasferimento del rame. L'analisi dei campi elettrostatici viene effettuata tramite la risoluzione numerica dell'equazione di Poisson-Boltzmann utilizzando il programma commerciale DelPhi della MSI. Inoltre attraverso un programma di dinamica Browniana siamo in grado di predire la velocita' di associazione tra il sito attivo di una macromolecola ed un substrato carico. Tale programma, da noi sviluppato, permette di calcolare la probabilita' d'urto tra sito attivo e substrato al variare del campo di forze elettrostatiche prodotte dalla macromolecola ed ha permesso la progettazione e la produzione di una serie di mutanti di Cu,Zn SOD ad aumentata attivita' enzimatica . Simulazioni di dinamica molecolare sono state utilizzate per confrontare ed interpretare dati sperimentali ottenuti su enzimi attraverso lo scattering dei neutroni o attraverso misure di attivita' catalitica ed affinita' verso inibitori o leganti di proteine native e mutanti fornendo un'interpretazione del comportamento funzionale osservato sperimentalmente. A tale scopo e' stato modificato un programma di dinamica molecolare public available DL-POLY in cui sono state implementate e perfezionate alcune metodologie di calcolo che hanno portato alla realizzazione di DL-PROTEIN un programma in grado di simulare in modo molto efficiente macromolecole proteiche con la possibilita' di utilizzare vari campi di forze. E' stato inoltre realizzato del software per l'analisi dei dati dinamici. Il gruppo di avvale di un centro di calcolo composto da due stazioni Silicon Graphics O2 r5000 con 128Mb RAM e 2Gb HD per la grafica, di un'Alpha Station digital 3000/300X con 112Mb RAM e 10Gb HD e di un server Silicon Graphics Origin 200 a 4 processori r10000 con 512Mb RAM e 33 Gb HD per il calcolo intensivo.

11. Fanelli F, Menziani MC, Scheer A, Cotecchia S, De Benedetti PG
Theoretical study on receptor-G protein recognition
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The rhodopsin family of receptors employs guanine nucleotide binding proteins (G proteins) to transduce signals across the cell membrane. All these receptors share the presence of seven hydrophobic regions that are believed to form a bundle of a-helical transmembrane domains connected by alternating intracellular and extracellular hydrophilic loops. The G proteins consist of three subunits a, b and g. In the inactive state, G proteins form membrane-associated abg heterotrimers, with GDP tightly bound to the a subunit. Upon activation by extracellular signals, the receptors catalyze the exchange of bound GDP for GTP promoting a variety of intracellular biochemical events. Despite the fact that recent crystallographic studies of G protein a subunits and heterotrimers have begun to show how G proteins might work, a consistent description of the mechanisms of receptor activation as well as of receptor catalyzed nucleotide exchange in terms of both structure and dynamics still remains a daunting task. One obvious problem is the lack of the high resolution structure of G protein coupled receptors (GPCRs). Recently, we used all the experimental information available on GPCRs for building a 3D model of the Gaq coupled a1b-adrenergic receptor (a1b-AR) and employed a combined experimental and Molecular Dynamics (MD) simulated mutagenesis approach to investigate the activation mechanism of this receptor [1-3]. These studies suggested that the highly conserved polar amino acids in the seven-helix bundle play a fundamental structural role, driving the motion of the helices which culminate into a rearrangement of the cytosolic domains that are involved in receptor/G-protein recognition. The mutation- and agonist-induced active states of the receptor share several structural peculiarities including: a) the release of some constraining interactions found in the wild type receptor and/or in its inactive mutants and b) the opening of a cytosolic site formed by i2, i3 and the cytosolic extension of helices 5 and 6. New insights into the mechanism of receptor activation were gained by simulating the association between several active forms of the a1b-AR and the GDP-bound Gaqb1g2 heterotrimer [4], by means of automatic rigid body docking [5]. The results of this study provided useful suggestions about the potential receptor-G-protein interface. The same approach was also employed to investigate the domains involved in receptor homodimerization [4] as well as the molecular determinants of receptor/G protein specificity [6].

12. Fortugno P, Ferrè F, Felici F
Librerie di peptidi su batteriofagi come sistema sperimentale per lo studio delle interazioni molecolari
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: L'interazione tra molecole è un passo essenziale nella maggior parte dei processi biologici. Negli ultimi anni, la generazione di librerie molto vaste (composte di 10e7 - 10e8 varianti) di peptidi esposti sulla superficie di batteriofagi filamentosi ha fornito un potente strumento per l'identificazione e l'isolamento di ligandi per una data molecola tramite un approccio combinatoriale [1]. Queste librerie sono state costruite mediante il clonaggio di oligonucleotidi di sequenza casuale nei geni codificanti per le proteine capsidiche di batteriofagi filamentosi [2,3]. In questo modo, ogni diverso peptide è esposto su una particella fagica differente e da ciò quindi deriva che i peptidi esposti su fago hanno l'utilissima proprietà di essere fisicamente associati alla loro informazione genetica corrispondente. Utilizzando una data molecola come "target" è possibile purificare per affinità, dalla miscela estremamente eterogenea che costituisce la libreria, quelle particelle fagiche ricombinanti che espongono sulla loro superficie sequenze peptidiche in grado di legarsi a questa molecola. La sequenza di questi peptidi così selezionati può essere rapidamente ed efficientemente ricavata mediante il sequenziamento del DNA che è incapsidato nelle stesse particelle fagiche [4]. La strategia di selezione appena descritta è stata applicata a molti differenti sistemi ligando/ligato, portando all'identificazione di nuove sequenze peptidiche, le quali non necessariamente somigliano a quelle naturali (ovvero a quelle dei ligandi originali), tuttavia mostrano una analoga specificità di legame; sono state perfino isolate sequenze peptidiche in grado di mimare molecole non proteiche [5]. La suddetta complessità delle librerie di peptidi su batteriofagi però, pur essendo sufficiente a selezionare ligandi specifici, è di molti ordini di grandezza inferiore a quella necessaria a contenere tutte le possibili varianti di una sequenza amminoacidica di lunghezza paragonabile ad un dominio proteico, ad esempio per una sequenza di 20 amminoacidi le teoriche possibili combinazioni sono circa 10e26, per una di 30 oltre 10e39. Risulta quindi evidente che la costruzione e la manipolazione di una libreria teoricamente "completa" di strutture proteiche casuali è improponibile. Una soluzione praticabile può essere quella di generare diversità mediante cicli successivi di mutagenesi e selezione, mimando in pratica quello che avviene naturalmente nel processo di evoluzione biologica. Le tecnologie di manipolazione genetica possono permettere di accelerare questo processo, in maniera che generazioni composte da molti milioni di mutanti possono essere prodotte e selezionate in cicli molto rapidi. Il nostro lavoro è stato diretto a mettere a punto la strumentazione biologica (librerie e vettori) e le metodologie (protocolli mirati di mutagenesi e selezione) per dimostrare che un tale approccio all'ingegneria proteica mediante tecniche di evoluzione molecolare è effettivamente possibile.

13. Fraternali F, Anselmi C, Temussi PA
Composti vegetali neurologicamente attivi e ormoni peptidici: un legame chirale
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: La differenza piu' drammatica tra oppioidi derivati dalle piante e peptidi oppioidi e' l'inversione di chiralita' del carbonio alfa della unita' tiramminica comune alle due classi di composti. Questa inversione e' tanto piu' sorprendente se si considera che il composto di partenza nella biosintesi degli alcaloidi dell'oppio e' pur sempre la L-tirosina, cioe' il primo residuo di tutti i peptidi oppioidi. Noi ipotizziamo che la presenza di Gly2 o D-Ala2 nei due piu' comuni domini messaggio degli oppioidi (YGGF e YaF) serva a compensare l'inversione di chiralita', consentendo l'accessibilita' di conformazioni non canoniche. Una scansione pressoche' completa dello spazio conformazionale accessibile a Tyr-D-Ala-Phe-NH-CH3 e al suo isomero Tyr-L-Ala-Phe-NH-CH3 conferma questa ipotesi e contribuisce a stabilire un solido collegamento tra oppioidi alcaloidici e peptidici. Questo risultato rafforza la convinzione che la morfina, come altri composti neurologicamente attivi presenti nelle piante, possa legarsi, nelle piante, a recettori endogeni preposti a sistemi di comunicazione cellulare. Un "sottoprodotto" non banale dell'analisi conformazionale e' una conformazione bioattiva per peptidi contenenti il messaggio YaF molto piu' attendibile di quelle derivate da studi di tipo SAR.

14. Fraternali F, Pastore A
Modularity and homology: the complete modelling of titin the type II module family
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The homology modelling of the structures of the 162 type II modules from the giant multi-domain protein titin is reported. The package Modeller was used and implemented in an automated fashion using four experimentally solved structures as templates. Validation of the models was addressed in terms of divergence from the template and consensus of the alignments. The homology within the whole family of type II modules as well as with the templates is relatively high (30-40% identity and ca. 60% similarity). Comparison between the models of domains for which an NMR structure has been solved with the experimental solution gives an estimate of the quality. Our results allow us to distinguish a number or structurally relevant residues that are therefore conserved in the whole family and buried in the hydrophobic core from those residues that are exposed and conserved. These will be funtionally relevant. Comparison of exposed conserved patches for modules in different regions of the titin molecule suggests potential interaction surfaces. Our results may be tested directly for those modules whose binding partner is known.

15. Frontali C, Pizzi E
Introni e regioni intergeniche in Caenorhabditis elegans presentano correlazioni a lungo range nell'uso di oligonucleotidi
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Viene presentato un metodo che consente di rivelare correlazioni nell'uso di insiemi di 'parole', di lunghezza data, lungo sequenze genomiche. La costruzione di 'diagrammi di ricorrenza' permette di suddividere porzioni genomiche in base al regime di ricorrenza, in accordo con l'ipotesi che pressioni selettive diverse, operando su elementi funzionalmente diversi di uno stesso genoma, possano favorire strategie alternative di codifica dell'informazione. In questo tipo di rappresentazione, introni e regioni intergeniche sono caratterizzati da regimi a ricorrenza elevata, ovvero da 'linguaggi' più ridondanti (e tolleranti rispetto ad errori) che non le regioni codificanti per proteine. La costruzione di 'profili di ricorrenza' permette di scorrere lunghe porzioni genomiche evidenziando picchi di ricorrenza per un dato insieme di oligonucleotidi. L'esplorazione di estese porzioni del cromosoma 3 di C. elegans rivela l'esistenza di una correlazione nell'uso di oligonucleotidi tra introni e regioni intergeniche, che si estende su distanze dell'ordine delle megabasi.

16. Guffanti A, Banfi S, Borsani G, Simon G
Strategies and Tools for EST Data Mining
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Expressed Sequence Tags (ESTs) constitute an important source of information for laboratories interested in the identification of novel gene sequences. We developed bioinformatic strategies and tools which rely on dbEST sequence data mining in order to support the effort of disease gene identification both at TIGEM and worldwide. One example of systematic human EST analysis is the DRES (Drosophila Related Expressed Sequences) project. As a starting strategy, we applied the power of Drosophila genetics to identify novel human genes of high biological interest. Sixty-six human cDNAs (called DRES clones) showing significant homology to Drosophila mutant genes were identified by screening dbEST with keywords, and their map position was determined experimentally. Based on this approach we developed the "DRES Search Engine", a tool for the systematic identification of human cDNAs homologous to Drosophila genes through an automated sequence database searching procedure. The homepage of the DRES project is at the WWW address http://www.tigem.it/LOCAL/drosophila/dros.html. Other tools of interest to the researchers interested in maximizing the information associated with a single cDNA sequence are freely available at the WWW address http://www.tigem.it/LOCAL/sequtils.html : - the "In Situ Blast" server performs a library-specific (and consequently tissue-specific) Blast search against one or more given cDNA libraries belonging to the UniGene EST cluster database; - the "UniBlast" server performs a local Blast search against the UniGene database or against UniNewGene, a locally generated version of UniGene devoid of all the clusters containing an already known mRNA or coding sequence; - the "EST Assembly Machine" and the "EST Extractor" will build sequence contigs (corresponding to "virtual transcripts") from the UniGene EST cluster database or from dbEST respectively, starting from a sequence Accession Number or a plain DNA/Protein sequence. This procedure extends a given cDNA sequence information through repeated cycles of sequence comparison, ideally providing the sequence of a full-length transcript starting from a single query sequence.

17. Lanave C, Attimonelli M, De Robertis M, Licciulli F, Liuni S, Sbisà E, Saccone C
Update of AMmtDB: a database of multi-aligned metazoa mitochondrial DNA sequences.
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The present paper describes AMmtDB a database collecting the multi-aligned sequences of Vertebrate mitochondrial genes coding for proteins and tRNAs, as well as the multiple alignment of the Mammalian mtDNA main regulatory region (D-loop) sequences. The genes coding for proteins are multi-aligned based on the translated sequences and both the nucleotide and aminoacid multialignments are provided. As far as the genes coding for tRNAs are concerned, the multi-alignments based on the primary and the secondary structures are both provided; for the Mammalian D-loop multialignments we report the conserved regions of the entire D-loop (CSB1, CSB2, CSB3, the Central region, ETAS1 and ETAS2) as defined by Sbis? et al. (1). A flatfile format for AMmtDB has been designed allowing its implementation in SRS (2) (http://bio- www.ba.cnr.it:8000/BioWWW/#AMMTDB). Data selected through SRS can be managed using GeneDoc (3) or other programs for the management of multi-aligned data depending on the userís operative system. The multiple alignments have been produced with CLUSTALV (4) and PILEUP (5) programs and then carefully optimized manually.

18. Liuni S, Attimonelli M, Lanave C, Pesole G, Brunetta S, Catalano D, Ceci LR, D'Elia D, Grillo G, Licciulli F
BIOWWW: a pool of specialised databases and algorithms for the analysis of biosequences
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The detemination of nucleic acids and protein sequences, made ever easier and faster by modern technologies and instruments, has allowed considerable progress in biomedical research. Nowadays exponential growth in the number of amminoacid and protein sequences needs computer-based technologies and tools for their management and analysis. Furthermore, suitable network infrastructures are also instrumental for researchers to access these data from the PC on their desk and analyse them with specific algorithms. To this purpose we have developed a WEB interface (BioWWW) which allows to access different specialised databases and biosequence analysis methods developed within the research activities of the Italian EMBnet node and of other EU funded projects. Products presently available under BioWWW are the following: - MmtDB, a metazoan mitochondrial DNA variant database; - KEYnet, a hierarchically structured database classifying genes and proteins according to their function; - UTRdb, a non-redundant database of untranslated 5' and 3' sequences of mRNA from eukaryotes; - PLMItRNA, a higher plant mitochondrial tRNA genes and molecules database. - WORDUP, an algorithm to determine statistically significant oligonucleotides in isofuctional sequence collections; - CODONTREE, a programme for the analysis of codon usage in protein coding genes; - PATSCAN, a programme to identify complex patterns in nucleotide and amminoacid sequences. The site BioWWW (http://bio-www.ba.cnr.it:8000/BioWWW/#AMMTDB) is constantly updated as new programs and databases are made available by our research group.

19. Maglio O, De Marino S, Fraternali F, Pastore A
Molecular Replacement in NMR Structure Determinations
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Protein structure determination by NMR spectroscopy has become an essential tool in biological laboratories and so new methods are necessary, to perform 3D-structure determinations automatically. In view of the larger number of sequences becoming available, for example, from genome projects, the structural determination on a large scale is required, which could not be carried out without a high degree of automation. One of the most time-consuming steps in protein structure determination is the spectral assignment procedure. This involves two main phases: a) sequence specific resonance assignment of the nmr signals; b) assignment of the NOESY spectra with collection of a list of distance constraints: the crucial step. Advanced iterative approaches have been suggested to automate the assignment of NOESY spectra and 3D-structure calculation. We suggest an approach that simulates "molecular replacement methods" now currently in use in crystallography. A structure, obtained for instance from homology modelling or x-ray coordinates, may be used as template to automatically provide an initial guess. This structure can be then routinely refined against the experimental NMR data. We have applied this approach to determine the structure of Phl p II allergen, a protein of 96 residues with an immunoglobulin-like fold, of which both nmr and x-ray structures were available.

20. Melchionna S
Simulazione di proprieta' strutturali e dinamiche di proteine
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Negli ultimi anni sono stati sviluppate alcune "tools" computazionali al fine di studiare nel dettaglio le proprieta' di interesse biofisico di proteine. Lo strumento computazionale di maggiore utilita', al fine di analizzare proprieta' micro e mesoscopiche, e' la Dinamica Molecolare. Lo sforzo di ricerca ha portato a sviluppare il programma DL-PROTEIN (S.Melchionna e S.Cozzini, 1998) distribuito alla comunita' internazionale in modalita' shareware. Questo codice permette notevoli avanzamenti rispetto ai tradizionali codici commerciali (Gromos, Charmm, Amber) sia per quanto riguarda la flessibilita' dei force fields utilizzabili (in principio si possono usare tutti i force field abituali adattando nel caso i parametri di interazione) e sia per la trattazione dettagliata delle interazioni microscopiche (ad esempio circa la delicata questione dell'elettrostatica). L'uso massiccio di questo nuovo programma ha prodotto risultati molto incoraggianti nello studio di proteine quali la Superossido Dismutasi Bovina e la Mioglobina di Capodoglio. Abbia investigato alcune proprieta' che nel passato hanno prodotto risultati controversi, quali le fluttuazioni atomiche (fattori di Debye-Waller), la loro dispersione sull'estensione proteica, e proprieta' di respirazione collettiva di queste proteine. Lo stato termodinamico e' stato studiato in diverse condizioni di temperatura e pressione. I risultati hanno mostrato un notevole miglioramento rispetto ai dati ottenuti con precedenti simulazioni e codici, e quindi un accordo quantitativo con gli esperimenti. In particolare abbiamo ottenuto informazioni primarie circa l'interpretazione della transizione quasi-vetrosa in proteine e l'analisi di modi localizzati su diverse scale spaziali.

21. Milanesi L
GeneBuilder: Prediction of gene structure in different eukaryotic organisms.
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Prediction of protein-coding genes in newly sequenced DNA becomes very important in large genome sequencing projects. In order to integrate the promoter with the gene structure information we have developed the GeneBuilder system able to predict the main functional signals (promoters, splice sites, TATA-box and Poly-A sites) and the coding regions (CDS). The program use several parameters and modules for gene structure analysis, homology search and automatic annotations. To improve the accuracy of the gene structure prediction the GeneBuilder program is also able to define new gene models by using different exon homology levels with a protein sequence selected from a list of homologous proteins. By using a Java based graphical interface the user can visualise the gene models and the sequence pattern of features predicted (http://www.itba.mi.cnr.it/webgene)

22. Minicozzi V, Morante S
Molecular mimicry: statistical analysis and evolutive implications
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The hypothesis of the existence of generally spread out evolutive convergence processes, guided by the phenomenon of "molecular mimicry" between viruses and their hosts, has been put forward by many authors . We present here a thorough statistical investigation aimed at testing the experimental basis of this conjecture. To this end we have adapted to this problem a previously developed code , designed to select "biologically homologous" pairs of short sequences of amino-acids (peptides) belonging to non-homologous proteins, with the idea of comparing the actual number of homologous peptide pairs found by the searching algorithm among different classes of proteins with the number expected from purely statistical considerations. Although the data we have collected do not yield a clearcut answer to the question concerning the existence of possible evolutive convergence processes, in analyzing murine-virus proteins versus murine proteins, we have found that most of the homologous peptide pairs selected by our algorithm happen to belong to a class of proteins, called "transforming proteins" , that are known to be associated with various types of murine cancers. Unfortunately we cannot offer any satisfactory biological explanation for such an unexpected but very suggestive result.

23. Pascarella S, Angelaccio S, Contestabile R, Delle Fratte S, Di Salvo M, Bossa F
The structure of serine hydroxymethyltransferase as modeled by homology and validated by site-directed mutagenesis
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Serine hydroxymethyltransferase (SHMT: E.C. 2.1.2.1) catalyzes the reversible conversion of serine and tetrahydropteroylglutamate (H4PteGlu) to glycine and 5,10-methylene-H4PteGlu. This reaction is the major source of one-carbon groups required in the biosynthesis of methionine, choline, thymidylate, and purines. The SHMT enzyme is widely distributed in nature, and found in both prokaryotic and eukaryotic cells with the latter containing both cytosolic and mitochondrial forms. In addition to H4PteGlu, the enzyme also requires pyridoxal 5'-phosphate (PLP) as a coenzyme. It is one of a group of PLP enzymes that cleave one of the bonds at the a-carbon of their amino acid substrate. These are referred to as the _-family of PLP enzymes and include the transaminases and amino acid decarboxylases. Three-dimensional structures have been determined for several members of the _-family of vitamin B6-dependent enzymes. Amongst them are aspartate aminotransferase (AAT), tyrosine phenol-lyase (1TPL), _-amino acid aminotransferase, 2,2-dialkylglycine decarboxylase (2DKB), ornithine aminotransferase, glutamate-1-semialdehyde aminomutase, and ornithine decarboxylase (1ORD). Despite the widely differing reaction specificity and weak sequence similarity, these proteins share the same basic folding pattern which was assumed also for SHMT (2). The prolonged unavailability of the SHMT atomic structure prompted the construction of a three-dimensional "homology" model that integrated knowledge regarding the enzyme acquired through site-directed mutagenesis experiments and other experimental measures. E. coli SHMT was modelled because most of experimental data are available for this enzyme. New features of the active site are proposed for further experimental testing.

24. Pedretti A, Vistoli G, Villa AM, Villa L
Modelling of the interactions of some inhibitors with the Farnesyl Protein Transferase by BioDock- a Stochastic Approach to the Automated Docking of ligands to biomacromolecules.
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Oncogenic mutations of the mammalian Ras protooncogene have been implicated in 20%-30% of all human cancers. A key step in a series of posttranslational modifications of the oncogene product Ras is the S- farnesylation of a cystein residue near the C-terminus in a reaction catalyzed by the enzyme farnesyltransferase (FTase) using farnesyl diphosphate (FPP). This step is important for the association of the GTP-binding Ras protein to the inner surface of the plasma membrane, where it mediates cellular trasformations.Thus, FTase is a current target for small molecule inhibitors. Two types of FTase inhibitors have been designed on the basis of the structure of the two substrates of the reaction, farnesyl diphosphate mimics and Ras CAAX tetrapeptide mimics. Some well known inhibitors have been docked to the FTase structure, as recently obtained by X ray crystallographic analysis, in order to highlight possible interaction differences.

25. Pesole G
Metodi per la ricerca di oligonucleotidi con attività regolatoria nelle regioni non tradotte degli mRNA eucariotici.
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: La delucidazione dei meccanismi molecolari alla base della regolazione dell'espressione genica è tra le sfide più affascinanti della moderna Biologia. Infatti, per la conprensione di processi fondamentali come l'embriogenesi, lo sviluppo o il differenziamento, non è sufficiente conoscere l'intero catalogo dei geni che una cellula può esprimere ma è necessario determinarne le modalità di espressione sia in relazione al contesto spazio-temporale che alla risposta a determinati stimoli ambientali. Le regioni non codificanti del genoma eucariotico, che nell'uomo costituiscono circa il 97% dell'intero genoma, considerate a lungo essenzialmente "junk DNA", svolgono un ruolo cruciale nella regolazione dell'espressione genica come si può rilevare da evidenze sperimentali sempre più numerose. Tra le regioni non codificanti del genoma abbiamo focalizzato la nostra attenzione alle regioni non tradotte alle estremità 5' e 3' degli mRNA eucariotici (5'UTR e 3'UTR). Al fine di condurre uno studio sistematico di tali regioni che svolgono importanti funzioni nel controllo della efficienza traduzionale, della stabilità e della localizzazione subcellulare degli mRNA, abbiamo realizzato UTRdb [1], un database specializzato e non ridondante di tali sequenze. L'attuale versione di UTRdb contiene oltre 100.000 sequenze relative a mRNA di organismi eucariotici. Le entries di UTRdb sono annotate con numerose informazioni non presenti nella banca dati primaria tra cui la presenza di elementi regolatori la cui attività biologica sia stata già dimostrata mediante indagini sperimentali. Tali elementi regolatori, che generalmente consistono di brevi tratti oligonucleotidici spesso in grado di assumere specifiche strutture secondarie, sono generalmente target di proteine regolatorie. I vari elementi funzionali che vengono annotati nelle entries di UTRdb sono collezionati a loro volta nel database UTRsite che viene continuamente arricchito di nuovi patterns funzionali che via via vengono descritti in letteratura. Sulla base di informazioni derivanti da analisi comparative, dalla letteratura o direttamente dai ricercatori che abbiano contribuito alla loro caratterizzazione sperimentale, per ciascun pattern funzionale viene costruito un pattern consensus che sia ricercabile con il programma PATSCAN in nuove sequenze nucleotidiche. L'introduzione nell'algoritmo PATSCAN di una opportuna procedura di simulazione mediante "sequence shuffling" ci consente anche di determinare, per ciascun pattern funzionale, il grado di sensibilità e di selettività della ricerca effettuata che è fondamentale per valutare la significatività biologica dei patterns che eventualmente venissero identificati in sequenze di cui non si disponesse di dati sperimentali relativi alla attività funzionale considerata. Il database UTRdb è interrogabile per mezzo del sistema SRS (http://bio-www.ba.cnr.it:8000/srs/) che consente numerosi criteri di selezione e permette cross-links con le banche dati primarie. Abbiamo anche messo a punto l'utility UTRscan (http://bigarea.area.ba.cnr.it:8000/BioWWW/#UTRscan) che consente, utilizzando un browser, di ricercare in una qualunque sequenza che venga sottomessa la presenza di elementi funzionali annotati in UTRsite. Oltre a ricercare elementi funzionali che siano già stati caratterizzati sperimentalmente è di grande interesse ricercare nuovi patterns, che per le loro insolite proprietà statistiche, siano potenziali candidati di elementi funzionali. A questo scopo abbiamo sviluppato l'algoritmo WordUP [2-4] che determina, in una collezione di sequenze isofunzionali quegli oligonucleotidi che siano significativamente condivisi o evitati. L'applicazione dell'algoritmo WordUP alle collezioni della banca dati UTRdb relative a vari raggruppamenti tassonomici ci ha consentito di individuare oltre a patterns oligonucleotidici già noti per la loro attività funzionale, nuovi patterns la cui attività biologica potrà essere verificata per mezzo di opportune indagini sperimentali.

26. Romani A, Petronini PG, Borghetti AF
Modello Tridimensionale del Dominio Tirosina-chinasico Associato al Recettore dell'EGF.
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Il recettore per l'Epidermal Growth Factor(EGFR) e' un importante glicoproteina transmembrana, dotata di attivita' fosfotransferasica. Questo recettore e' coinvolto nella crescita e nella differenziamento cellulare, nello sviluppo embrionale e nella trasformazione neoplastica. Attualmente non sono state ancora depositate presso la PDB (Protein Data Bank) le coordinate tridimensionali ottenute mediante metodi sperimentali(NMR,X-Ray) del dominio tirosina-chinasico associato all'EGFR. Diversi autori hanno proposto modelli teorici di tale dominio. Per migliorare l'accuratezza della struttura teorica e per ottenere ulteriori informazioni abbiamo costruito un nuovo modello di tale dominio basato non solo sulla similarita' tra sequenze aminoacidiche ma anche utilizzando un approccio denominato "inverse folding approach" che si basa sull'algoritmo THREADER sviluppato da D.T. Jones, all' Universita' di Warwick. Un plausibile "fold" del dominio tirosina chinasico e' stato trovato nella proteina lck, nel recettore dell'insulina e nell'adenilico ciclasi (PDB-code 3lck, 1ir3, 1atp). La struttura tridimensionale e' stato costruita, a partire da diversi allineamenti di sequenza (ottenuti con diverse matrici di sostituzione),con il metodo denominato "spatial restrain" implementato in MODELLER. Il valore di "energy threading" ha permesso la selezione del miglior modello. Il successivo affinamento strutturale e' stato ottenuto mediante il pacchetto AMBER ver.5. Il modello da noi ottenuto sembra essere in buon accordo con le proprieta'strutturali delle proteina-chinasi ed ha delle caratteristiche peculiari in confronto ai modelli teorici del dominio tirosina-chinasico dell'EGFR presenti in letteratura.

27. Rossi G
Modeling Biological Systems by Computer Simulations
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Abstract - A general presentation of the possibilities offered by numerical simulations for the modelization of certain biological systems is given. In this context applications of standard methods of Statistical Mechanics to two particularly interesting biological problems 1) protein folding 2) dynamical and thermodynamical behaviour of lipidic billayers will be discussed.

28. Saccone C
Evolutionary genomics: the metazoan mitochondrial dna
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: One of the most important aspect of the mitochondrial genome evolution in Metazoa, is the constancy on size and gene content of the mtDNA whose plasticity is maintained through a great varieties of gene rearrangements probably mediated by tRNA genes. It was generally accepted that there is a trend to maintain the same genetic structure within the phylum but more recent reports show that a consistent number of transpositions are also observed between closely related organisms. Base composition of mtDNA is extremely variable. Often the GC-content is low and, when it increases, the two complementary bases distribute in a asymmetric way, creating, particularly in vertebrates, a negative GC-skew. We have found in mammals that the base composition of the coding strand and the degree of gene variability are related to the asymmetric replication mechanism of mtDNA. A quantitative measurement of mtDNA evolutionary rate, has revealed that the various component have different evolutionary rates. tRNA genes are among the most conserved but, when compared to nuclear counterparts, they evolve 100 times faster. Finally we describe molecular phylogenetic reconstructions, some of which have revealed unexpected findings, and may change our vision for the classification of the living organisms.

29. Tramontano A, Angeletti P
About Bioinformatics
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: The goal of Bioinformatics, in my view, is to develop and use a combination of computational approaches to learn as much as possible about proteins and the relationship between their sequence, structure and function. Molecular modelling techniques and methods for sequence and structure analysis become extremely powerful when they are combined with the results of experiments designed ad hoc and consequently all my recent projects have been carried out in collaboration with the experimental groups of IRBM. We have modelled the Hepatitis C Virus (HCV) protease, helicase, polymerase and E2 envelope glycoprotein, designed chimeric HCV proteins, analysed biochemical results in the context of the protein structures, modelled the protease domain of HCV-related viruses and, for the HCV vaccine program, we have designed a library aimed at mimicking the hypervariable region 1 of HCV and analysed the results of its selection and screening. These activities span a number of areas of Bioinfomatics and have had an impact on the development of new therapeutical agents.

30. Via A, Brannetti B, Zanzoni A, Cesareni G, Helmer-Citterich M
Profili tridimensionali: studio di similarita' tra superfici proteiche
Meeting: BIOCOMP 1999 - Year: 1999
Full text in a new tab
Topic: Bioinformatics

Abstract: Abbiamo sviluppato (De Rinaldis et al., 1998) un programma per calcolatore in grado di generare un profilo tridimensionale a partire da una sovrapposizione di superfici proteiche che condividono la stessa funzione. L'analisi del profilo 3D ricavato da tale sovrapposizione consente: 1) lo studio dei determinanti strutturali di superficie associati ad una determinata funzione biologica; 2) la selezione di proteine con una determinata proprietà funzionale a partire da una banca dati di strutture; 3) l'identificazione di strutture proteiche da utilizzare come possibili "scaffold" di nuove funzioni in seguito a mutagenesi sito-specifica; 4) di indagare la possibilità di costruire due superfici proteiche con caratteristiche chimiche e funzionali simili su fold differenti e di analizzare il database di strutture note per vedere se la selezione naturale abbia mai esplorato questa opportunità attraverso una sorta di evoluzione convergente. Abbiamo applicato la procedura allo studio della tasca di legame dei domini SH2 e SH3 e della superficie associata alla struttura del p-loop. I profili 3D delle tasche di legame dei domini SH2 e SH3 riconoscono tutte le strutture degli SH2 e degli SH3 presenti nel dataset; il profilo associato al p-loop riconosce 17 delle 20 strutture proteiche contenenti un p-loop e presenti nel dataset. L'analisi del profilo 3D del p-loop ha consentito l'identificazione di una carica positiva e di una carica negativa conservata nello spazio, ma non nella sequenza. Stiamo applicando il metodo all'analisi dell'intero database delle proteine a struttura nota (PDB) per identificare funzioni definite eventualmente da pattern di sequenze diversi (motivi diversi nel database PROSITE (Bairoch, 1991; Bairoch et al., 1997), ma che possano invece essere riconosciute da un motivo di superficie unico, definito col metodo dei profili 3D.



BITS Meetings' Virtual Library
driven by Librarian 1.3 in PHP, MySQLTM and Apache environment.

For information, email to paolo.dm.romano@gmail.com .